Welcome![Sign In][Sign Up]
Location:
Search - ictclas csharp

Search list

[Other resource多种分词方法

Description: 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope for all the Chinese Processing usable to. ICTCLAS algorithm, Chinese Academy of Sciences, the strong name recognition. VC development. CSharp-term, forward backward matching increase maximum matching, C# development, easy expansion. Small Columbus Word, the largest forward after the match, C# development. Xerdoc-term ICTCLAS Java-based version of Word. Text Word dictionary, Word dictionary, the word can provide a breakdown of data sources.
Platform: | Size: 20833489 | Author: 阿瑟多幅 | Hits:

[AI-NN-PR多种分词方法

Description: 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope for all the Chinese Processing usable to. ICTCLAS algorithm, Chinese Academy of Sciences, the strong name recognition. VC development. CSharp-term, forward backward matching increase maximum matching, C# development, easy expansion. Small Columbus Word, the largest forward after the match, C# development. Xerdoc-term ICTCLAS Java-based version of Word. Text Word dictionary, Word dictionary, the word can provide a breakdown of data sources.
Platform: | Size: 20833280 | Author: 阿瑟多幅 | Hits:

[Search EngineSharpICTCLAS

Description: ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库),它们的文件格式是完全相同的,都使用CDictionary类进行解析。如果想深入了解ICTCLAS词典结构,可以参考sinboy的《ICTCLAS分词系统研究(二)--词典结构》一文,详细介绍了词典结构。 -ICTCLAS word of the overall process include: 1) initial segmentation 2) POS tagging 3) names, places identification 4) to re-word 5) This five-step re-speech tagging. The first word, the thin, divided into: 1) atom splitting 2) to identify all the possible atomic set of words between the program 3) N-shortest paths Chinese words rough three steps.
Platform: | Size: 1965056 | Author: ounata | Hits:

[Search EngineICTCLAS2010CSharpDemo

Description: 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过200KB,各种词典数据压缩后不到3M,是当前世界上最好的汉语词法分析器。- Linux_CDemo_32Bit_sample Linux_CDemo_64Bit_sample Linux_JNIDemo_32Bit_sample Linux_JNIDemo_64Bit_sample windows_cDemo_32_sample windows_cDemo_64_sample win_csharp_32_sample win_csharp_64_sample Win_JNI_32_sample Win_JNI_64_sample
Platform: | Size: 93184 | Author: Liuying | Hits:

CodeBus www.codebus.net